数据分析师的学习路径


今天在公司的论坛里发现一个同学问了个问题,我把给TA的回答也发在公众号里,希望你也能看看。也非常欢迎你能对我的回答提出不同意见和建议,欢迎交流。

Q: 作为数据分析,目前刚刚学完SQL,接下来是应该把空余时间的重点精力放在数学上还是业务上?

我的回答:

数据分析学的不是工具。其实数据分析最先开始要学的是分析和解决问题的思路,学会拆解问题的方法,找到问题的根源,知道使用什么工具或者算法能更好地解决问题,然后再去匹配知识储备、技能、工具。现用现学往往是最直接最有效最能沉淀和记忆的学习方法。

如果从数据分析流程上来看:

第一步拆解问题:业务流程法、决策树法、公式法等等。另外数据的描述性统计也能帮你更快发现问题,找到问题根源。其中一些战略方法也能帮你梳理分析思路,比如PEST,SWOT,波特五力,BCG矩阵等等。特别是矩阵的变通应用能特别好解决很多业务问题,提问的同学有兴趣可以跟我讨论我给你一些案例。

第二步收集数据:数据分为内外部数据,内部数据就是公司内部产生的数据,业务监控指标,埋点或者游戏内的用户聊天记录等等。外部数据就是比如市场调研、竞品等的数据。这里面要学习的就是对业务的理解,比如至少知道AARRR里各阶段都用什么指标可以做量化衡量。另外做用户调研的时候也会应用到如何合理设计问卷,以及问卷可信度分析,比如AHP(行政部门做供应商比选也可以用AHP)。

第三步数据的清洗和整理:数据收集后还要做清洗和整理,比如查找缺失值、异常值,做数据的归一化、标准化,标签编码,one-hot编码等等,这些如果能掌握一些工具会很方便,推荐学Python数据分析相关课程或书籍,不要跑偏去学python编程了。另外推荐用VS code的同学使用Data Wrangler插件。

第四步,就是应用工具和算法了,统计学(相关性分析、方差分析、卡方独立性检验、各种假设检验、各种分布、时间序列、季节分解)、监督学习(回归,分类器)、非监督学习(聚类、关联规则、对应分析、协同过滤)、深度学习(神经网络、LSTM)、强化学习(智能体)、NLP等等。(但是我觉得作为数据分析而言,深度和强化先不着急学)算法都是需要Features的,那怎么设计和获取Features,就需要对业务清晰,你要知道游戏里的各种埋点的数值对应的现象和影响是什么,对用户的行为有了解,并能对应到相关的量化指标。技术上来说也可以学习下特征工程方面的东西。

第五步,就是决策建议,也就是要落地。数据分析产出的不是漂亮的报表和Dashboard,而是分析问题的原因和解决方案或者决策支持,以及后续怎么跟踪和验证结果的方法,怎么确定解决方案和建议是有效的。如果没有效果还要从前面几个步骤再来甚至从头再来。这里面就有涉及了试验设计,如A/B Test和T检验、方差分析等等。

贯穿整个流程里还需要对数据的展示及BI层面有一些了解和清楚怎么能监控和向需求方展示清楚。在整个流程里也会涉及到如何用类似ChatGPT这类工具辅助你的工作。

希望我这个回答能帮提问的同学梳理一下思路。有兴趣欢迎一起学习和探讨。


来源:炳叔读数据


加入CPDA,全面提升数据分析能力!